خوشه بندی اسناد xml به منظور کشف دانش

پایان نامه
چکیده

امروزه اطلاعات موجود بر روی وب به سرعت در حال افزایش است و حجم بسیار زیادی از این اطلاعات در قالب xml ارائه شده است. یکی از مزایای اصلی استفاده از xml، نمایش داده های غیر ساخت یافته است که قابلیت های بسیاری را در اختیار کاربران قرار می دهد. ویژگی غیر ساخت یافته بودن اطلاعات و انعطاف پذیری xml باعث همه گیر شدن استفاده از آن شده است. با توجه به رشد فزاینده ی تعداد اسناد xml، سازماندهی موثر این اسناد xml به منظور بازیابی اطلاعات مفید از آنها ضروری است. یک راه حل امکان پذیر، انجام خوشه بندی بر روی اسناد xml به منظور کشف دانش است که باعث ارتقای مدیریت موثر داده ها، بازیابی اطلاعات و پردازش پرس و جو ها می شود. با این حال، مسائل بسیاری در کشف دانش از این نوع مدارک نیمه ساخت یافته با توجه به ناهمگونی و بی نظمی ساختاری آنها به وجود می آیند. بسیاری از پژوهش های موجود بر روی تکنیک های خوشه بندی، فقط بر روی یکی از ویژگی های اسناد xml، یعنی ساختار و یا محتوای آنها و با توجه به مشکلات مقیاس پذیری و پیچیدگی و آن هم در محدوده زبان انگلیسی متمرکز هستند. در این پایان نامه پس از بررسی روش های موجود، روشی برای خوشه بندی اسناد فارسی xml مبتنی بر هر دو ویژگی ساختاری و محتوایی اسناد و با استفاده از الگوریتم بهینه سازی رقابت استعماری ارائه می شود. برای اثبات کارایی و دقت خوشه بندی روش پیشنهادی از معیارهای موجود بهره گرفته و این روش با نمونه های قبلی ارائه شده مقایسه می شود.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

خوشه بندی اسناد xml با استفاده از جنبه های مختلف اسناد

به واسطه قالب نیمه ساختیافته و خاصیت خود توصیف بودن، xml به ابزاری مناسب جهت بازنمایی و تبادل داده روی وب تبدیل گشته و امکان مدل کردن انواع مختلفی از داده ها را فراهم کرده است. با توجه به گسترش روزافزون استفاده از اسناد xml روی وب و اهمیت سازماندهی این اسناد، مطالعه و بررسی این موضوع و ایجاد بهبود روش های خوشه بندی اسناد xml جهت استفاده موثرتر از آنها ضروری می نماید. یکی از مهمترین چالش های موج...

بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو

بسط پرس‌وجو به‌عنوان یکی از روش‌های انطباق پرس‌وجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش می‌دهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرس‌وجو است که فرض می‌کند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرس‌وجو هستند و کلمات بسط را از این اسناد انتخاب می‌کند. درحالی‌که ممکن است اسناد نامرتبط به پرس‌وجو در اسناد رتبه‌بالا وجود داشته باشد. روش‌هایی برای انتخاب اسناد مرتبط و نادیده گرفتن...

متن کامل

خوشه بندی مشتریان به منظور تدوین استراتژی تخفیف دهی ، مطالعه موردی شرکت کدبانو

در طی سال های گذشته تعامل شرکت ها با مشتریانشان به طور قابل توجهی تغییر کرده است به طوری که تداوم کسب و کار با مشتری تضمین بلند مدت ندارد. به همین دلیل برای موفقیت یک سازمان لازم است سازمان ها نیازهای مشتریان خود را به درستی درک کرده؛ خواسته های آنها را پیش بینی کنند و با مجهز شدن به این دانش، استراتژیها و برنامه های فروش و بازاریابی خود را بهبود بخشند. یکی از راه های شناخت مشتریان، از طریق خوش...

متن کامل

خوشه ‏بندی مفاهیم و رویدادهای نوپدید سازماندهی دانش

هدف: هدف از انجام این پژوهش، بررسی و مصورسازی ساختار فکری حوزه سازمان‌دهی دانش در وبگاه علم در بازه زمانی 1900-2018 و خوشه‏‌بندی مفاهیم و رویدادهای نوپدید این قلمرو موضوعی است. روش‌‏شناسی: پژوهش حاضر از نوع کاربردی است و به روش هم‌‏واژگانی با رویکرد تحلیلی انجام شده است. به‌ منظور انجام تحلیل هم‌واژگانی، از خوشه‌بندی سلسله‌مراتبی و مقیاس چندبُعدی استفاده ش...

متن کامل

الگویابی داده‌های لرزه‌یی با استفاده از خوشه بندی به منظور پیش بینی زلزله

زلزله‌ها همواره به‌عنوان یکی از مخرب‌ترین بلایای طبیعی شناخته می‌شوند. به دلیل خسارت‌های اقتصادی و تلفات جانی بسیار بالا، پیش‌بینی زلزله امری ضروری به نظر می‌رسد. در این نوشتار، تغییرات زمانی پارامتر $b$ از رابطه‌ی گوتنبرگ ریشتر قبل از زلزله‌هایی با بزرگای $M_w=6.0$ و یا بالاتر از آن در ناحیه‌ی جنوبی ایران، منطقه‌ی قشم و اطراف آن مورد بررسی قرار گرفته است. از دو روش خوشه‌بندی K-M‌e‌a‌n‌s و نقشه...

متن کامل

خوشه بندی فراابتکاری اسناد فارسی اِکس اِم اِل مبتنی بر شباهت ساختاری و محتوایی

با توجه به رشد فزاینده ی تعداد اسناد xml، سازماندهی موثر این اسناد به منظور بازیابی اطلاعات مفید از آنها ضروری می باشد. یک راه حل امکان پذیر، انجام خوشه بندی بر روی اسناد xml به منظور کشف دانش است. مسئله کلیدی در خوشه بندی اسناد xml این است که چگونه می توان شباهت بین اسناد xml را اندازه گیری کرد. استفاده از روش های متداول خوشه بندی اسناد متنی که اطلاعات محتوایی را برای اندازه گیری شباهت سند بکا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه گیلان - دانشکده فنی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023